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基于 自 引 网 络 和 主 路 径 分 析 的 论文 主题 创新 
实证 研究 


E 魏 瑞 试 
安徽 财经 大 学 管理 科学 与 工程 学 院 ” 蚌 堆 233030 


摘要 : [目的 /意义 ] 探 讨 如 何 从 大 量 论文 中 快速 发 现 相关 论文 ,研究 论文 主题 创新 的 方法 ,为 研究 者 阅读 
和 利用 期 刊 论文 提供 参考 。[ 方 法 /过 程 ] 在 对 论文 主题 创新 和 自 引 网 络 概念 界定 的 基础 上 ,提出 研究 论文 主题 
创新 的 思路 、 方 法 和 工具 。 以 美国 印第安 纳 大 学 在 图 书 情报 学 领域 的 论文 为 例 进行 实证 研究 。[ 结果 /结论 ] 利 
用 主 路 径 分 析 可 以 快速 从 自 引 网 络 中 发 现 由 于 引用 而 产生 联系 的 论文 ,在 此 基础 上 可 以 进行 主题 创新 分 析 。 
关键 词 : 主题 创新 主 路 径 分 析 自 引 网 络 ”研究 主题 
工分 类 号 : G250 
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创新 是 科学 共同 体 获得 社会 承认 的 根本 依据 。 A 
把 创新 作为 科学 共同 体 的 行为 规范 , 是 要 求 “ 科 学 研 o 
帘 痪 果 总 应 该 是 新 颖 的 。 一 项 研究 没有 给 充分 了 解 
生理 解 的 东西 增添 新 内 容 ,， 则 无 所 贡献 于 科学 ”。 科 


2 论文 主题 创新 与 自 引 网 络 和 主 路 径 


论文 主题 创新 
论文 创新 可 以 有 不 同 角度 ,如 研究 主题 .研究 方法 


证 酒 过 生产 知识 可 以 里 得 科 学 其 加 信和 社 公 的。 或 研究 结论 等 。 本 研究 探讨 的 是 期 刊 论文 的 主题 他 
53H p ^ 识 可 了 上 得 斗 当 ZN H tE i 1 通信 
员 通 过 生产 知识 可 以 获得 科学 Due 新 。 在 判断 期 刊 论文 主题 是 否 有 创新 时 ,通常 是 将 其 


承志 与 奖赏 ,而 创新 成 为 科学 家 获得 社会 承认 的 根 p m LE 
Fm". maere momo mg 。 “有 的 研究 成 果 比 较 之 后 得 出 的 结果 。 判 断 论文 主 
ibd 题 创新 可 以 分 为 3 个 层面 的 内 容 , 一 是 有 没有 创新 ;第 
要 址 现形 式 。 通 过 期 刊 论文 的 内 容 可 以 了 解 其 创新 S ea ie ob T 
IX anag? GC 打 大 明 中 从 学 术 期 刊 编 二 是 在 哪些 方面 有 创新 ;第 三 是 创新 的 程度 。 本 研究 
NU qe ,ww ”针对 第 一 个 和 第 二 个 层面 进行 研究 , 即 论文 的 主题 是 
但 钢 角 度 ,探讨 了 评价 论文 创新 性 的 一 些 具体 做 法 o 
和 科技 期 刊 论文 创新 性 鉴 审 的 4 个 基本 要 素 。 曹 妍 O o n pe 
等 中 利用 德尔 非法 构建 了 护理 论文 创新 性 评价 指标 。 CIC EEDIBUCN. MEA EEE 
KE. REPODUTEU REP INeUemu y EU CANNAE. TERDITEOCERL GUI RU RH 
以 为 具体 和 科学 的 参考 ， 但 是 对 于 已 经 发 表 过 的 “， 需 要 考虑 很 多 因素 :四 是 时 间 因素 ,在 判断 论文 主题 创 
这 此 方法 就 有 较 大 的 局 限 性 。 本 研究 尝试 利用 主 路 ， 析 其 主题 是 否 具 有 创新 ,分 析 的 依据 通常 是 反映 其 主 
径 分 析 方法 和 内 容 分 析 方法 相 结合 的 方式 来 对 论文 。 起 的 专业 术语 。@ 范 围 因素 ,如 以 一 个 学 者 的 期 刊 论 


研究 主题 的 创新 进行 探索 性 研究 。 由 于 创新 的 相对 SAARE, SARAAN AE: UO 


性 特点 ,本 研究 将 相关 研究 界定 在 一 个 机 构 的 研究 在 特定 领域 的 研究 成 果 为 数据 集 ,可 以 研究 该 数据 集 
成 果 范围 之 内 进行 探讨 。 范围 内 该 机 构 研 究 人 员 的 创新 。 本 研究 的 研究 对 象 主 
要 局 限 在 一 个 机 构 范 围 之 内 。 机 构 论文 主题 创新 的 判 
断 有 两 个 角度 ,一 个 是 对 机 构 内 研究 者 的 研究 成 果 进 


* 本 文系 国家 社会 科学 基金 项 目 “ 期 刊 论文 创新 性 评价 标准 及 其 计量 模型 研究 "(项 目 编号 :12BTQ034) 研究 成 果 之 一 ， 
作者 简介 : 魏 瑞 斌 (ORCID : 0000 -0001 -6271 -7881) ,教授 ,博士 , E-mail;rbwxy@126. com, 
收 稿 日 期 :2017 -07 -24 修 回 日 期 :2017 -11 -20 本 文 起 止 页 码 :64 -70 本 文责 任 编辑 : 王 传 清 


64 


魏 瑞 试 .基于 自 引 网 络 和 主 路 径 分 析 的 论文 主题 创新 实证 研究 [J]. 图书 情报 工作 ,2018 ,62(3 ) :64 -70. 


行 比较 ,一 个 是 放 在 一 个 更 大 的 范围 内 与 机 构 外 的 研 
究 成 果 进 行 比较 。 本 研究 侧重 于 第 一 种 情况 的 比较 。 
图 判断 论文 主题 创新 通常 是 根据 反映 其 研究 主题 的 专 
业 术语 ,如 A 论文 的 研究 主题 是 共 词 分 析 ,B 论文 的 研 
究 主题 是 信息 检索 。 这 些 专业 术语 可 以 来 自 论文 的 题 
名 ,摘要 ,关键 词 或 全 文 等 途径 ,如 T. Amajd 等 "在 对 
作者 .期刊 等 进行 排序 时 ,将 其 分 为 多 媒体 检索 .医学 
信息 检索 和 数据 库 和 查询 处 理 3 个 研究 主题 。 

2.2 自 引 网 络 

通过 论文 引用 的 关系 ,可 以 发 现 不 同 研究 主题 之 
间 的 关系 ,也 可 以 作为 判断 论文 研究 主题 创新 的 一 个 
角度 。I. Hellsten 等 "提出 了 作者 自 引 网 络 ,并 指出 作 
者 自 引 网 络 能 够 更 好 地 发 现 作者 新 的 研究 主题 。J.Y. 
Lee 认为 ,作者 自 引 网 络 能 够 成 功 地 识别 作者 的 核心 
论文 和 领先 成 果 。 笔 者 认为 , 自 引 网 络 可 以 分 为 不 同 
展 鸭 。 作 者 自 引 网 络 叫 是 指 某 作者 及 其 合作 者 撰写 的 
认 这 集合 中 ,论文 之 间 引用 与 被 引 所 形成 的 引文 网 络 。 
桃 得 自 引 网 络 则 是 同一 机 构 的 研究 者 ,引用 自己 的 文 
献 或 者 是 引用 同一 机 构 内 其 他 研究 者 的 成 果 , 而 形成 
的 本 ) 文 网 络 。 在 本 研究 的 机 构 自 引 网 络 中 ,节点 代表 
枕 构 研究 者 发 表 的 论文 ,节点 之 间 的 连 线 表示 论文 之 
闻 的 引用 关系 。 自 引 网 络 还 可 以 包括 更 加 宏观 的 地 区 
eatem e B aL A 

之 通常 情况 下 ,一 个 研究 者 与 同一 机 构 同一 学 科 的 


茂 慌 研究 者 之 间 由 于 空间 等 因素 ,相互 之 间 的 学 术 交 
流 比 较 频繁 ,对 彼此 的 研究 主题 较为 了 解 , 合 作 的 可 能 
性 比较 大 。 机 构 自 引 网 络 一 方面 反映 出 同一 机 构 内 的 
研 老 者 ,在 从 事 科 学 研究 过 程 中 ,其 关注 的 知识 在 自己 
和 同一 研究 机 构 研 究 者 之 间 的 传播 过 程 ,同时 相对 客 
观 地 反映 了 同一 机 构 研究 者 的 研究 主题 的 变化 。 
2.3 XB 

主 路 径 分 析 最 早 是 由 N. Hummon 和 P. Dereian ! 从 
网 络 连通 性 出 发 提出 的 ,其 主要 目标 是 通过 识别 出 引文 
网 络 中 具有 最 大 连通 度 的 系列 文献 来 概述 研究 领域 的 
发 展 态势 以 及 领域 演化 过 程 中 的 主要 文献 .主要 人 物 与 
主要 事件 。W. Goffman™! „M. Jahn 4? 基于 引文 网 络 
方法 的 研究 结果 表明 :一 个 专业 是 由 其 历史 发 展 中 出 现 
的 为 数 不 多 且 极 其 重要 的 事 或 人 所 定义 的 。 这 一 结论 
为 引文 网 络 主 路 径 方法 的 产生 提供 了 理论 支持 。 

主 路 径 分 析 的 理论 前 提 是 将 引文 网 络 看 作 一 个 输 
送 知识 信息 的 渠道 系统 。 如 果 一 篇 论文 能 够 把 之 前 一 
些 论文 的 知识 整合 到 一 起 ,并 且 为 新 知识 的 增长 做 出 
实质 性 贡献 ,那么 这 篇 论文 就 有 可 能 被 大 量 引用 ,而 且 


有 可 能 使 此 后 再 引用 此 前 的 论文 变 得 有 点 多 余 。 因 
此 ,这 种 论文 就 成 了 渠道 系统 中 的 重要 枢纽 ,大 量 知识 
言 息 从 此 处 流 过 5 。 韩 琢 和 人 金 匠 辉 国 深入 分 析 了 引 
文 网 络 主 路 径 分 析 方 法 的 产生 背景 .基本 内 涵 与 算法 
实现 ,并 总 结 主 路 径 分 析 在 理论 及 应 用 研究 中 存在 的 
EHH. MEADE 研究 发 现 ,学 者 们 对 主 路 径 
方法 已 有 的 修正 和 拓展 工作 主要 聚焦 于 主 路 径 方法 的 
选择 原则 ,搜寻 起 点 的 确定 和 弧 的 权重 设置 3 个 部 分 。 

MARKS ipi" RR AI 等 研究 看 , 主 路 径 
分 析 方 法 可 以 帮助 研究 者 快速 从 引文 网 络 中 发 现 重要 
的 研究 成 果 , 并 且 能 直观 反映 出 研究 成 果 之 间 的 引用 
和 被 引 关 系 。 本 研究 利用 的 主 路 径 分 析 方 法 是 将 论文 
通过 引用 关系 连接 在 一 起 ,同时 结合 时 间 因 素来 分 析 
这 些 论文 在 研究 主题 方面 的 创新 。 


3 ”研究 思路 研究 工具 与 方法 
3.1 研究 思 
3.1.1 收集 数据 以 某 个 机 构 名 称 为 检索 对 象 ,从 特 
定 引文 数据 库 中 获取 其 论文 数据 。 由 于 数据 格式 和 处 
理工 具 的 局 限 ,本 研究 使 用 采集 自 Web of Knowledge 
平台 的 期 刊 论文 数据 。 
3.1.2 数据 处 理 从 Web of Knowledge 收集 的 数据 ， 
利用 HistCite 软件 的 Graph Maker 功能 可 以 快速 生成 
数据 对 应 的 自 引 网 络 。 自 引 网 络 的 数据 可 以 直接 保存 
成 . net 文档 。 同 时 ,利用 HistCite 软件 还 可 以 自动 统计 
出 每 篇 论文 的 局 部 被 引 、 全 局 被 引 等 相关 数据 ,为 后 续 
的 数据 分 析 提 供 数 据 支持 。. net 文档 可 以 直接 导入 Pa- 
jek 软件 中 做 进一步 的 处 理 。 在 Pajek 中 可 以 直接 获取 
每 篇 论文 的 点 度 中 心 度 等 网 络 计 量 指标 ,并 可 以 生成 
可 视 化 的 引文 网 络 图 。 
3.1.3. 数据 分 析 结合 利用 Pajek 生成 的 引文 网 络 图 
和 每 篇 论文 的 相关 数据 ,可 以 进一步 分 析 论 文 在 整个 
引文 网 络 中 所 处 的 位 置 ; 通 过 对 论文 原始 信息 分 析 可 
以 确定 其 研究 主题 。 结 合 论文 的 时 间 属 性 来 分 析 机 构 
研究 主题 创新 。 
3.2 研究 方法 与 研究 工具 

本 研究 应 用 主 路 径 分 析 方 法 (main path. analysis, 
MPA) 对 自 引 网 络 进行 研究 。 主 路 径 分 析 方 法 是 一 种 
于 分 析 时 间 流 的 特殊 技术 。 引 文 网 络 可 以 看 作 是 一 
个 输送 科学 知识 或 信息 的 渠道 系统 。 如 何 知 识 通过 引 
文 关系 而 流通 ,那么 参与 许多 论文 之 间 路 径 的 某 个 引 
文 关 系 , 就 要 比 很 少 参 与 论文 之 间 路 径 的 另 一 个 引文 
关系 重要 。 那 些 最 重要 的 引文 关系 就 形成 了 一 条 或 多 
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条 主 路 径 , 这 可 能 是 一 项 研究 传统 的 骨架 。 

Pajek 4. 06 版 本 与 以 前 版 本 的 功能 有 一 定 差异 ， 
新 版 本 中 提供 了 主 路 径 分 析 的 不 同方 法 供用 户 选择 。 
如 :QD Network -Acylic Network -Create Weighted Network 
+ Vector -Traversal Weights -Search Path Count ( SPC )/ 
Search Path Link Count( SPLC)/ Search Path Node Count 
( SPNP) ; Network -Acylic Network -Creat ( Sub ) Network - 
Critical Path Method -CPM , KIS 307; VE [HE PONE 
这 些 不 同 的 方法 进行 了 具体 的 解释 。 本 研究 利用 第 2 
种 方法 来 寻找 引文 网 络 中 的 主 路 径 。 


4 实证 研究 


4.1 数据 获取 
= 本 人 研究 以 Web of Science 核心 合集 为 数据 源 ,选取 
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1 篇 论文 的 引文 网 络 ,并 将 引证 网 络 原始 数据 保 
J, net 文档 ,再 导入 Pajek 进行 后 期 处 理 。 

4.2 ”数据 分 析 
4.2.1 引证 网 络 整体 分 析 ”点 度 是 指 一 个 节点 所 拥 
有 的 连 线 数量 , 它 是 一 种 离散 属性 。 在 引证 网 络 中 , 它 
表征 一 篇 论文 引用 其 它 论文 或 被 其 它 论文 引用 的 数 
量 。Pajek 的 分 区 功能 (partition) ,可 以 计算 出 每 个 节 
点 的 度数 (包括 引用 网 络 中 其 它 论文 的 数量 和 被 其 它 
论文 引用 的 数量 ) ,也 可 以 单独 计算 。 在 整个 引证 网 络 
中 ,有 731 个 节点 ,497 条 连 线 ,其 密度 为 0.000 9 ,节点 
平均 度 为 1.359 8。 这 些 数据 反映 出 此 引证 网 络 中 论 
文 之 间 的 引用 关系 并 不 是 特别 密切 。 从 表 1 可 以 看 
出 ,点 度 为 0 的 节点 有 382 个 , 占 总 体 数量 的 52.26% , 
即 有 一 半 以 上 的 论文 与 其 它 论文 之 间 没 有 引用 和 被 引 
用 关系 ;有 133 篇 论文 与 其 它 论 文 之 间 的 引用 和 被 引 
只 有 1 次 。 这 反映 出 印第安 纳 大 学 的 学 者 在 信息 科学 
和 图 书馆 学 领域 的 引用 行为 存在 着 集中 与 分 散 的 现 
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印第安 纳 大 学 学 者 在 信息 科学 和 图 书馆 学 领域 1986 
年 -2017 年 发 表 的 论文 。 最 终 检索 结果 为 731 条 记 
录 。 具 体检 索 式 如 下 : 

地 址 : (Indiana University ) 

精炼 依据 :Web of Science 类 别 : ( INFORMATION 
SCIENCE LIBRARY SCIENCE ) 

时 间 跨 度 :1986 - 2017, RE]: SCI-EXPANDED, 
CPCI-S, CPCI-SSH, CCR-EXPANDED, IC, 

从 图 1 中 可 以 看 出 ,1990 年 - 1996 年 ,机 构 的 发 
文 数量 呈现 为 一 个 快速 增长 的 趋势 ;1997 年 开始 有 一 
个 下 降 , 但 其 整体 保持 在 20 篇 -40 篇 之 间 , 少 数 年 份 
达到 了 50 篇 。 这 从 一 定 程度 上 反映 出 印第安 纳 大 学 
在 信息 科学 和 图 书馆 学 领域 的 论文 数量 较为 稳定 。 


TI 


k 


2006 
2007 
2008 
2009 


OQ e H cp oco 5 pe y 
cQ. € d! | uu € Cx 
& Saad 6 & à& 


2005 


1 印第安 纳 大 学 在 信息 科学 和 图 书馆 学 领域 发 文 数量 分 布 


象 。 

从 统计 结果 看 ,剔除 孤立 节点 之 后 的 部 分 规模 较 
小 的 连通 子 网 络 中 ,节点 数量 大 部 分 在 2 个 到 6 个 之 
间 ,但 有 一 个 包含 238 个 节点 的 最 大 连通 子 网 络 。 本 
研究 将 最 大 连通 子 网 络 中 的 238 篇 论文 按 其 发 表 时 间 
分 为 5 个 时 间 窗 口 :1992 年 - 1997 年 .1998 年 - 2002 
年 .2003 年 - 2007 年 .2008 年 - 2012 年 和 2013 年 - 
2017 年 。 然 后 利用 Pajek 绘制 5 个 时 间 窗 口内 论文 间 
引证 网 络 的 变化 情况 。 从 图 2 可 以 看 出 ,第 1 个 时 间 
窗口 只 有 10 篇 论文 ,其 中 有 2 篇 有 引用 关系 ,另外 8 
篇 都 是 孤立 的 节点 ;第 2 个 时 间 窗 口 有 56 个 节点 ,这 
56 个 节点 已 经 形成 了 一 个 较 大 的 连通 网 络 ;第 3 个 到 
第 5 个 时 间 窗 口 的 节点 数 分 别 为 111 个 、181 个 和 238 
个 。 随 着 时 间 的 推移 ,论文 间 由 于 引用 关系 , 越 来 越 多 
的 论文 节点 被 连接 起 来 ,最 终 形成 一 个 较 大 的 连通 网 
络 。 从 论文 引用 的 角度 看 ,连通 子 网 络 反 映 了 其 研究 


主题 之 间 的 延续 性 ,而 孤立 节点 则 反映 其 研究 主题 之 
间 的 分 散 性 。 
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R1 网 络 中 各 个 节点 的 点 度 分 布 情况 


Cluster Freq Freq( % ) CumFreq CumFreq( 46 ) Representative 
0 382 52.257 2 382 52.257 2 1 PUTTAPITHAKPORN S, 1990 
1 133 18.194 3 515 70.451 4 4 NISONGER TE, 1992 
2 93 12. 722.3 608 83.173 7 43 Rosenbaum H, 1996 
3 36 4.924 8 644 88.098 5 37 OVERHAGE JM, 1995 
4 29 3.967 2 673 92.065 7 159 Harter SP, 1998 
5 14 1.915 2 687 93.980 8 226 Mostafa J, 2000 
6 9 1.231 2 696 95.212 198 Cronin B, 1999 
7 7 0.957 6 703 96.169 6 175 Mostafa J, 1998 
8 8 1.094 4 711 97.264 119 Cronin B, 1997 
9 9 1.2312 720 98.495 2 176 Cronin B, 1998 
10 1 0.136 8 721 98.632 544 Yan EJ, 2011 
11 4 0.547 2 725 99. 179 2 259 Cronin B, 2001 
12 3 0.410 4 728 99.589 6 233 Kling R, 2000 
13 1 0.136 8 729 99.726 4 306 Borner K, 2003 
14 1 0. 136 8 730 99. 863 2 526 Ding Y, 2011 
16 1 0. 136 8 731 100 578 Lariviere V, 2012 


图 2 机 构 自 引 网 络 最 大 子 网 络 的 变化 


-二 本 研究 根据 节点 的 点 人 中 心 度 和 点 出 中 心 度 ,将 
238 个 节点 分 为 3 种 类 型 。 

(1) 知识 输出 型 论文 。 此 类 型 节点 的 点 出 中 心 度 
大 于 点 人 中 心 度 (两 者 差 值 大 于 等 于 3 ) , 约 占 总 体 数 
量 的 14% 。 这 些 论 文 是 该 机 构 某 个 研究 主题 的 早期 
研究 成 果 , 对 后 续 相 关 研 究 有 引领 作用 。 如 41 号 论 
X ,被 网 络 中 其 它 9 篇 论文 引用 ,但 是 没有 引用 其 
它 论文 。 该 文 提出 了 一 个 解释 决策 支持 系统 功能 绩效 
的 新 模型 。 

(2) 知识 吸收 型 论文 。 此 类 型 节点 的 点 人 中 心 度 
大 于 点 出 中 心 度 (两 者 差 值 大 于 等 于 3 ) , 约 占 总 体 数 
量 的 13% 。 此 类 论文 通常 是 在 对 前 期 比较 多 的 研究 
成 果 梳理 的 基础 上 ,形成 的 较 新 的 阶段 性 研究 成 果 。 
如 第 148 号 论文 5 ,引用 了 网 络 中 的 10 篇 论文 ,但 只 
被 其 它 论文 引用 1 次 。 该 文 在 社会 临场 感 理论 等 基础 
上 提出 了 一 个 合作 研究 的 整合 理论 模型 。 


(3) 知识 吸收 与 输出 均衡 论文 。 此 类 型 节点 的 点 
入 中 心 度 与 点 出 中 心 度 相差 不 大 (两 者 差 值 小 于 等 于 
2) , 约 占 总 体 数 量 的 73% 。 这 类 论文 是 机 构 中 间 阶 段 
的 研究 成 果 。 如 126 号 论文 " ,引用 网 络 中 的 3 篇 论 
文 ,被 网 络 中 其 它 5 篇 论文 引用 。 该 文 是 作者 对 他 在 
1999 年 提出 的 媒介 同步 性 理论 (media synchronicity 
theory ( MST) ) 的 进一步 完善 和 拓展 。 

从 整个 引证 网 络 的 视角 看 ,在 被 引 频 次 接近 的 情 

况 下 ,知识 输出 型 论文 的 创新 性 较 高 ,其 次 是 知识 吸收 
型 论文 ;第 三 是 知识 输入 与 输出 均衡 型 论文 。 依 据 这 
个 标准 对 论文 创新 程度 进行 比较 时 ,需要 选择 同一 个 
时 间 窗 口 的 同类 论文 进行 比较 。 如 知识 输出 型 论文 发 
表 的 时 间 较 早 ,其 被 引 高 可 能 来 源 于 时 间 的 累积 优势 。 
单独 通过 被 引 频 次 来 比较 知识 输出 型 论文 和 知识 吸收 
型 论文 的 创新 是 不 合理 的 。 
4.2.2. EREDI ” 当 节 点 数 较 少时 ,可 以 通过 观察 
网 络 结构 中 节点 所 处 的 位 置 来 判断 一 篇 论文 在 引证 网 
络 中 的 地 位 和 作用 。 但 当 节 点 数 较 多 的 时 候 , 快 速 从 
网 络 中 寻找 一 些 重 要 的 论文 难度 就 会 加 大 。 本 研究 首 
先 利 用 Pajek 对 238 篇 论文 进行 处 理 ,结果 见 图 3( 图 3 
中 中 文 内 容 为 手工 添加 ) 。 根 据 论文 内 容 , 本 研究 将 图 
3 中 的 期 刊 论文 分 为 以 下 6 个 方面 。 

(1) 电 子 期 刊 与 学 术 交 流 。 该 方面 的 4 篇 论文 发 
KTF 1996 年 - 2000 年 期 间 ,代表 性 人 物 是 S. P. Har- 
ter。 文 献 50 和 文献 159 从 期 刊 论文 参考 文献 等 角度 
研究 了 电子 期 刊 对 学 术 交 流 的 有 影响。 文献 197 和 文献 
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学 科 相 似 性 和 差异 性 测度 主题 演化 模式 
679 Demarest B, 2015 688 Hu BB, 2015 
生物 偏 息 学 产 出 与 影响 
| Song M, 2014 


Ils Ni CQ, 2013 


678 Lariviere V, 2015 


D Sugimoto CR, 2016 年 龄 与 学 术 交 流 


团队 规模 影响 力 


“文献 计量 画像 ” 信息 系统 知识 结构 


学 术 期 刊 分 类 ER HS Mrd = 573 Sugimoto CR, 2012 * 
533 Ding Y, 2011 530 Ding Y, 20， 学 术 组 织 互动 588 Pratt JA 2012 
必 者 合作 网 络 544 Yan EJ, 2011 


流行 与 声望 1526 Ding Y, 2011 


合作 网 络 分 析 
创新 时 间 线 


481 Yan EJ, 2009 


424 Cronin B, 2007 
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227 研究 了 学 术 交流 中 电子 期 刊 出 版 的 政策 和 实践 。 
结合 该 数据 集 整 个 引文 网 络 看 ,文献 50 .159 .197 和 
2 从 被 引 的 次 数 分 别 为 2.3 .6 和 2 次 。 这 反映 出 该 机 
攀 看 这 个 领域 还 有 一 系列 相关 成 果 , 该 方法 只 呈现 出 
JE WARTE 3C. Ah, xc 159 和 文献 197 的 全 局 
被 下 分 别 达 到 53 次 和 72 次 ,这 反映 出 这 两 篇 文献 同 
时 虹 得 到 了 机 构 外 学 术 同 行 的 认可 。 
(2) web 引用 。 在 2001 年 — 2008 年 期 间 , 网 络 引 
用 堪 为 印第安 纳 部 分 学 者 关注 的 一 个 研究 主题 。 其 代 
物 是 B. Cronin FU L. Vaughan。 从 图 3 可 以 看 出 ， 
文献 244 在 网 络 中 占据 了 一 个 较为 重要 的 地 位 , 它 对 
网 络 中 其 它 相关 研究 起 到 了 比较 重要 的 引领 作用 。B. 
Cronin AH, EF Web 的 引文 分 析 为 文献 计量 学 领 
域 带 来 了 新 的 机 遇 。 该 文 既 是 对 其 机 构 内 其 他 同行 相 
关 研究 的 一 个 总 结 性 延续 ,同时 也 成 为 后 续 相关 研究 
的 一 个 基础 。 该 文 在 网 络 结构 中 起 着 一 个 承前启后 的 
重要 作用 。B. Cronin ™ 的 论文 标题 中 使 用 了 符号 资本 
的 概念 ,但 其 实际 上 是 利用 引文 次 数 web 点 击 率 和 媒 
体 提 及 率 3 个 指标 对 25 位 学 者 进行 相关 性 分 析 。 文 
献 326.373 和 438 中 ,L. Vaughan fil D. Shaw?" X} 4 ^ 
学 科 的 web 引用 数据 和 来 自 Web of Science ( WoS) 等 
途径 的 引文 数据 进行 了 相关 研究 。 这 些 研究 是 目前 图 
书 情报 领域 比较 热门 的 “替代 计量 学 ”的 研究 内 容 。 
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学 者 影响 力 
527 Yan EJ, 2011 


LIS 机 构 排 序 


425 Meho LI, 2007 
者 影响 力 排序 
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信息 科学 学 术 影响 力 评价 
js Meho LI, 2009 


引用 次 数 、 引 用 排序 和 | 指数 
455 Meho LI, 2008 


3k B Web 的 学 术 引 
lin Vaughan L, 2008 
, 2005 


知识 主张 Web 引用 数据 
357 Cronin 8, 373 Vaughan L, 2005 


文献 计量 与 Web 3| 
326 Vaughan L, 2003 


299 Cronin B, 2002 “符号 资本 ” 


„4244 Cronin B, 2001 基于 Web 的 引文 分 析 


197 king R, 1999 ”电子 期 刊 与 学 术 交流 


3 基于 主 路 径 分 析 的 引证 网 络 


就 展开 了 相关 研究 ,也 体现 了 其 研究 的 创新 性 和 前 瞻 
性 。 


(3) 科 研 合作 。 在 2003 年 - 2005 年 期 间 , 利 用 文 
献 信息 研究 科研 合作 成 为 其 研究 主题 。 代 表 人 物 是 
B. Cronin。 如 B. Cronin 和 D. Shaw 等 利用 传统 的 文献 
计量 学 方法 对 心理 学 和 哲学 领域 的 科研 合作 、20 世纪 
化 学 领域 的 合作 模式 、 科 研 合作 对 学 术 写 作 的 影响 等 
进行 了 相关 研究 。V. Lariviere 等 “通过 作者 数量 、 地 
址 数量 和 国家 数量 3 个 指标 对 团队 规模 对 学 术 影 响 力 
的 影响 进行 了 研究 ,发 现 团 队 规 模 越 大 ,作者 分 布 越 广 
iz ,其 论文 获得 的 被 引 次 数 越 多 。 

(4) 学 术 影 响 力 评 价 。 在 2005 - 2009 年 期 间 , 以 
L. Meho 为 代表 的 学 者 等 利用 传统 文献 计量 学 指标 和 
方法 对 科研 人 员 和 机 构 的 学 术 影 响 力 进行 了 相关 研 
究 。 如 工 . Meho 对 LIS 的 科研 人 员 和 机 构 的 科研 产 出 
进行 研究 .利用 bh 指数 分 析 信 息 科 学 家 的 学 术 影响 力 、 
基于 Web of Science ‚Scopus 和 Google scholar 3 个 数据 
源 对 25 个 LIS 领域 的 科研 人 员 的 学 术 影 响 力 进行 分 
析 ; 基 于 Scopus 和 Web of Science 数据 对 随机 挑选 的 
80 位 LIS 研究 人 员 进 行 了 相关 人 研究。 从 论文 引用 的 角 
度 来 看 ,该 文 对 后 续 相 关 研 究 也 产生 了 较 大 的 影响 。 

(5 ) 学 术 网 络 分 析 及 应 用 。 自 2009 年 开始 ,各 类 
学 术 网 络 的 研究 成 为 该 机 构 的 一 个 研究 主题 。 代 表 人 


从 余 厚 强 和 吨 均 平 .的 研究 看 ,替代 计量 学 的 概念 是 
Priem 在 2010 年 提出 的 。B. Cronin 等 人 自 2001 年 起 
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物 是 丁 预 和 受 乐 伽 等 。 他 们 从 网 络 视 角 对 各 类 学 术 网 
络 进行 了 相关 研究 。 如 利用 网 络 中 心性 指标 对 合作 网 
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络 进 行 分 析 ; 利 用 PageRank 算法 对 作者 影响 力 进 行 分 
析 ; 基 于 引文 网 络 和 合作 网 络 对 学 术 组 织 互动 进行 分 
析 ; 利 用 有 权 值 的 PageRank 算法 对 作者 引证 网 络 测度 
学 者 声誉 和 影响 力 进 行 分 析 ; 基 于 主题 的 PageRank 算 
法 对 作者 引文 网 络 等 展开 了 相关 研究 。 与 传统 的 文献 
计量 学 研究 相 比 ,这 类 研究 充分 利用 了 社会 网 络 分 析 、 
复杂 网 络 和 计算 机 科学 等 领域 的 研究 成 果 与 文献 网 络 
有 机 结合 ,是 文献 计量 学 领域 一 个 较 新 的 研究 方向 。 
(6) 其它 方面 。 在 整个 网 络 中 ,还 有 一 些 较 为 特 
别 的 研究 主题 。 如 J A. Pratt 等 ”针对 信息 管理 系统 
25 种 学 术 期 刊 的 数据 ,利用 共 引 分 析 、 多 维 尺 度 分 析 
和 主 成 分 分 析 等 方法 研究 了 该 领域 的 知识 结构 。 从 论 
文 内 容 看 ,J. A. Pratt 等 在 数据 选择 时 参考 了 文献 487 
的 秤 究 内 容 。 两 篇 研究 主题 虽然 有 一 定 差别 ,但 在 数 
据 需 源 方面 有 一 定 的 共性 。C. R. Sugimoto 和 B. Cro- 


会 学 .经济 学 和 政治 
党 的 1 000 多 位 学 者 的 年 龄 与 其 科研 产 出 、 合 作 和 影 
响 双 之 间 关 系 进行 了 定量 分 析 。 这 些 成 果 都 是 以 论文 


VERF 1996 年 - 2000 年 期 间 ,这 反映 出 研究 者 对 该 
主题 研究 的 持续 性 。 再 如 文献 388 $0527 研究 的 都 是 
学 者 影响 力 的 问题 ,但 是 所 采用 的 研究 方法 发 生 了 变 
化 ,这 体现 出 研究 主题 虽然 稳定 ,但 研究 内 容 方面 都 有 
创新 。 文 献 244'” 是 一 篇 对 web 引文 分 析 的 研究 成 
果 ,通过 文献 引用 关系 ,连接 了 电子 期 刊 与 学 术 交 流 和 
web 引用 两 个 研究 主题 。 这 反映 了 两 个 研究 主题 之 间 
有 一 定 的 关联 性 。 


人 


本 研究 尝试 利用 主 路 径 分 析 方 法 ,快速 从 一 个 比 
较 大 的 网 络 中 提取 了 一 部 分 引用 关系 更 为 密切 的 文 
献 , 通 过 这 些 文献 的 内 容 分 析 来 对 论文 主题 创新 进行 
比较 。 这 种 方法 还 可 以 应 用 在 更 微观 的 学 者 引文 网 络 
或 更 宏观 的 地 区 、 国 家 引文 网 络 的 研究 。 这 种 方法 由 
于 只 是 基于 主 路 径 分 析 方法 快速 发 现 引用 关系 比较 紧 
密 的 一 些 文献 ,因此 并 不 能 反映 某 机 构 论 文 主题 的 全 


部 内 容 。 如 图 3 中 出 现 的 文献 基本 都 可 以 归结 为 科学 
计量 学 的 范畴 ,但 从 原始 数据 可 以 发 现 ,印第安 纳 大 学 
学 者 还 涉及 到 信息 系统 、 社 会 信息 学 等 很 多 方面 的 人 研 
究 主 题 。 如 果 一 个 机 构 的 论文 主题 比较 分 散 或 研究 成 
果 数 量 较 少 ,或 者 机 构 内 研究 者 之 间 的 相互 引用 或 自 
引 较 少时 ,这 种 方法 都 有 可 能 不 适用 。 机 构 自 引 网 络 
构建 时 ,对 于 没有 引用 关系 的 文献 ,在 网 络 中 都 表现 为 
独立 的 节点 ,在 利用 主 路 径 分 析 时 ,这 些 独立 的 节点 都 
会 被 排除 。 但 机 构 自 引 网 络 可 以 把 机 构 研 究 相 关 性 较 
强 的 文献 的 关系 通过 引用 关系 揭示 出 来 ,对 于 研究 论 
文 的 创新 有 很 好 的 支撑 。 

论文 主题 创新 的 分 析 依 赖 于 对 论文 原始 信息 的 解 
读 , 对 于 少量 文献 ,采取 人 工 方 式 有 一 定 可 行 性 ,但 如 
果 是 对 大 量 文献 的 处 理 , 则 需要 借助 于 一 些 更 为 有 效 
的 自动 化 .智能 化 处 理 手段 。 人 工 方式 有 较 强 的 主观 
性 ,单纯 用 一 个 词语 来 概括 论文 的 内 容 不 能 保证 其 全 
面 性 和 准确 性 ,这 些 方 面 在 今后 的 研究 中 还 需 进 一 步 
改进 和 完善 。 
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Empirical Research on the Topic Innovation of the Paper Based on 
Self-citation Network and Main Path Analysis 
Wei Ruibin 


School of Management Science and Engineering, Anhui University of Finance and Economies, Bengbu 233030 


Abstract. [ Purpose/significance | This paper aims to study how to find the relative paper from large numbers of pa- 
pers and study on the topic innovation of the paper. It may help researcher to read and use those papers. [ Method/ 
process | First, the paper defined the concept of the topic innovation and the self-citation network. And then the paper 
brought out the research idea, the tools and the method. At last the paper studied the Indiana University’ s innovation in 
the library and information science. [ Result/conclusion | The result shows that the main path method can help to find 
these papers according to citation relationship from the self-citation network and analyze the topic innovation based on the 
result. 
self-citation network research topics 
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